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摘要 : 软 测量 在 数据 进行 采集 到 应 用 的 途中 经 常会 出 现 数据 缺失 的 情况 ， 这 将 
会 大 大 降低 建立 的 模型 的 精度 。 本 文 提 出 了 基于 变 分 自 编码 器 (Variational 
Autoencoder) 与 GRU 神经 网 络 建立 的 填补 模型 ， 并 通过 实际 工业 流程 验证 了 填 
补 后 数据 的 准确 性 。 最 后 实验 表明 VAE 填补 模型 在 缺失 率 为 10% 和 30% 情 况 下 
的 RMSE 和 MAE 分 别 为 3.316%，4.262% 和 2.386%，2.964%， 相 较 于 其 他 填补 
算法 PCA 和 SVD 均 有 更 显著 的 效果 ， 验 证 了 该 模型 的 可 行 性 。 
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Abstract: In the realm of soft sensing, missing data frequently occurs during the 
Journey from data collection to application, significantly diminishing model accuracy. 
This paper introduces a filling model based on the Variational Autoencoder (VAE) and 
GRU neural network. Validation through industrial processes confirms the accuracy of 
the imputed data. Experimental results demonstrate that the VAE imputation model 
yields an RMSE and MAE of 3.396% and 2.458% for missing rates of 10%, and 3.549% 
and 3.078% for missing rates of 30%, respectively. Compared to alternative imputation 
algorithms like PCA and SVD, the VAE model exhibits significantly enhanced 
performance, affirming the feasibility of this model. 
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在 如 今 的 工业 过 程 中 需要 实现 对 工业 过 程 的 实时 监控 , 质量 控制 , 异常 检测 ， 
生产 优化 等 目的 ， 都 是 通过 对 工业 过 程 在 的 数据 进行 软 测量 建 模 由 和 分 析 实 现 ， 
而 这 一 过 程 就 是 软 测量 所 6B1。 然 而 数据 缺失 在 软 测量 中 是 很 常见 的 问题 ， 在 实际 
应 用 中 常常 会 由 于 各 种 原因 ， 如 传感器 故障 ， 数 据 采 集 错 误 等 ， 过 程 数据 就 可 能 
会 出 现 缺失 由 65， 而 这 些 数据 的 缺失 就 会 严重 影响 软 测 量 的 建 模 和 预测 精度 ， 进 
而 影响 到 工业 生产 质量 ， 甚 至 影响 到 生产 的 安全 。 因 此 软 测量 研究 和 应 用 中 , 填 
补缺 失 数据 ， 提 高 模型 的 鲁 棒 性 和 预测 能 力 至 关 重 要 。 

目前 数据 填补 方法 分 为 三 种 ， 第 一 种 是 将 缺失 的 数据 直接 删除 ， 但 是 这 样 的 
操作 无 疑 会 造成 数据 中 重要 信息 的 缺失 , 在 实际 应 用 中 基本 上 不 会 采用 。 第 二 种 
是 基于 数学 统计 的 方法 名 ， 早 在 20 世纪 50 年 代 ， 缺 失 数据 的 填补 就 在 统计 学 领 
域 中 被 提出 ， 当 时 的 人 们 主要 采用 简单 的 插值 法 ,例如 均值 法 ， 中 位 数 法 ， 最 近 
邻 法 等 ， 这些 方法 虽然 简单 ,但 是 忽略 了 数据 间 的 相关 性 以 及 时 序 特征 ， 因 此 填 
补 的 准确 度 并 不 高 。 第 三 种 是 基于 机 器 学 习 的 方法 MI， 例如 近邻 中， 最 大 似 
然 估计 ,和 矩阵 分 解 理论 1 等 ,这些 方法 能 够 进一步 的 学 习 到 数据 间 的 相关 性 ， 并 
且 模 型 构建 简单 ， 计 算 参 数 也 较 少 。 但 是 在 工业 生产 过 程 中 ， 生 产 机 理 复杂 ， 并 
且 数 据 往 往 会 受到 多 种 因素 的 影响 , 而 数据 的 分 布 不 尽 相 同 , 数据 之 间 有 强 相关 
性 , 并 且 在 时 间 维 度 上 也 有 强烈 的 上 下 文 关 系 , 这 些 传 统 的 机 器 学 习 方法 假设 的 
分 布 与 实际 分 布 不 一 定 符合 ,并且 这 些 模型 往往 忽视 了 数据 的 时 序 特征 ， 所 以 以 
上 的 方法 均 不 能 很 好 处 理 生产 过 程 中 数据 填补 的 问题 。 

近年 来 , 深度 学 习 方 法 在 缺失 数据 填补 邻 域 广 泛 应 用 。 变 分 自 编码 器 (VAE) 
是 一 种 基于 深度 学 习 的 生成 模型 ， 是 在 2013 年 由 Kingma 和 Welling 提出 的 [1 
该 模型 由 于 其 能 够 学 习 数 据 的 潜在 特征 表示 , 生成 符合 真实 样本 分 布 规律 的 数据 ， 
目前 广泛 应 用 了 各 种 数据 样本 生成 领域 。 文 献 [12] 研 究 了 VAE 在 处 理 异 构 数据 
的 应 用 ， 在 VAE 的 基础 上 ， 通 过 对 连续 数据 和 离散 数据 独立 设计 神经 网 络 ， 提 
出 了 一 种 可 以 处 理 异 构 数 据 的 模型 。 这 些 模型 结构 简单 ， 模 型 训练 效率 高 ， 说 明 
了 VAE 模型 能 够 很 好 的 学 习 到 数据 间 的 特征 。 文 献 [13] 将 VAE 用 于 人 脸 修 复生 
成 ， 采 用 变 分 自 编 码 器 (VAE) 对 输入 的 基准 人 像 进行 低 程 度 的 人 脸 重 构 ， 然 后 
将 真实 的 基准 人 像 和 低 清晰 度 重 构 人 像 通过 隐 空 间 转 换 进行 域 对 齐 , 在 该 隐 空 间 
中 学 习 人 像 修 复 ， 在 保留 人 像 的 基本 构图 后 重新 得 到 一 张 全 新 的 高 清 细节 人 像 ， 
验证 了 VAE 模型 生成 数据 的 准确 性 。GRU (Gated Recurrent Unit) 是 一 种 循环 神 
经 网 络 模型 , 于 2014 年 由 Cho 等 人 提出 , 该 网 络 能 够 很 好 的 学 习 到 时 间 序 列 的 时 
序 特征 ， 并 对 数据 进行 动态 预测 , 但 是 对 于 学 习 数 据 间 的 潜在 特征 能 力 还 有 待 提 
高 。 

综 上 所 述 , 现 有 模型 不 能 满足 工业 生产 中 缺失 数据 填补 的 精度 需求 。 所 以 本 
文 利 用 VAE 提取 单一 序列 的 自 相关 性 信息 和 多 维 数据 的 互相 关 信息 获取 不 同 在 
线 检 测 状态 量 数据 的 相关 性 ， 再 结合 GRU 神经 网 络 学 习 数 据 分 布 ， 挖 掘 时 序 特 
征 ， 提出 VAE-GRU 缺失 数据 填补 模型 ， 并 通过 实际 脱 丁 烷 塔 工业 过 程 在 线 检测 
数据 对 模型 的 理论 有 效 性 和 工程 适用 性 进行 验证 。 


1 模型 研究 


1.1 VAE 模型 


变 分 自 编 码 器 拥有 与 自 编 码 器 结构 相似 的 编码 器 和 解码 器 以 外 ， 其 中 编码 器 
的 作用 是 学 习 输 入 数据 的 潜在 特征 的 空间 表示 , 而 解码 器 的 作用 是 从 获得 到 的 降 
维特 征 中 重 构 出 原始 的 输入 数据 , 还 额外 增加 了 隐 舍 变量 , 可 以 看 作 是 贝 叶 斯 网 
络 和 神经 网 络 的 混合 体 , 它 的 实质 就 是 将 提取 到 的 每 个 潜在 特征 表示 为 概率 分 布 ， 
当 从 潜在 状态 解码 时 将 从 每 一 个 分 布 中 进行 随机 抽样 , 生成 一 个 特征 向 量 作为 解 
码 器 的 输入 , 这 就 是 变 分 自 编码 占 模 型 最 精妙 的 地 方 , 通过 将 特征 表示 为 概率 分 
布 而 不 是 像 自 编码 器 那样 简单 的 特定 编码 表示 , 使 得 变 分 自 编码 器 有 了 强大 的 生 
成 能 力 ， 甚至 能 够 生成 原本 的 样本 中 原来 没有 的 新 样本 。 在 变 分 自 编码 器 模型 中 
编码 器 实质 就 是 一 个 变 分 推断 网 络 , 它 的 功能 就 是 用 来 得 到 输入 样本 的 均值 和 方 
差 , 而 变 分 自 编 码 器 模型 的 解码 器 则 可 以 看 为 是 一 个 将 隐 含 变量 映射 到 原始 变量 
的 生成 网 络 。 它 的 具体 结构 如 图 1 所 示 : 


真实 样本 抽样 样本 生成 样本 
图 1 变 分 自 编码 器 (VAE) 结构 示意 图 
通过 图 1 可 以 清晰 的 看 到 变 分 自 编 码 器 共 分 为 3 个 部 分 : 

(1) ”编码 层 : 真实 样本 通过 编码 层 以 后 推断 出 了 洪 在 分 布 的 方 关 和 均值 

(2) ” 隐 合 变量 : 也 就 是 图 1 中 通过 均值 和 方差 得 出 的 属于 真实 样本 的 专 
属 正 态 分 布 

(3) 解码 层 : 对 隐 变 量 采 样 以 后 得 到 特征 问 量 , 解码 层 通过 该 特征 向 量 来 

生成 新 的 样本 

该 模型 能 够 很 好 的 学 习 到 数据 的 潜在 表示 和 概率 分 布 ， 从 而 能 够 更 好 地 理解 
数据 的 结构 和 特征 ,这 使 得 该 模型 填补 的 数据 能 更 加 符合 实际 的 情况 ,这 是 选择 
该 模型 作为 填补 模型 的 最 大 原因 , 因为 实际 的 工业 过 程 数据 必须 是 符合 实际 情况 ， 
这 样 才能 保证 模型 预测 的 准确 性 。 其 次 该 模型 还 可 以 处 理 非 线 性 数据 ， 进行 非 线 
性 的 建 模 ， 有 着 处 理 复杂 数据 的 能 力 ， 这 使 得 该 模型 更 加 适用 于 工业 中 。 但 是 该 
模型 也 存在 着 不 足 的 地 方 , 就 是 该 模型 在 学 习 数 据 的 潜在 表示 和 生成 新 的 数据 时 ， 
通常 假设 数据 是 独立 同 分 布 的 , 并 且 不 考虑 时 间 序 列 数据 的 动态 性 , 这 就 意味 着 
传统 的 VAE 模型 不 能 考虑 到 工业 过 程 中 的 动态 性 和 序列 性 。 这 个 不 足 将 导致 该 
模型 的 建 模 预测 效果 不 达标 , 所 以 针对 这 个 问题 本 文 给 出 了 相应 的 解决 方案 即 对 
该 模型 进行 改进 。 将 VAE 模型 和 递归 神经 网 络 (RNN) 结合 起 来 ， 以 考虑 时 间 
序列 数据 的 动态 性 和 变化 规律 ， 本 文选 择 的 RNN 网 络 是 GRU 神经 网 络 。 经 过 
改进 得 到 的 VAE-GRU 模型 可 以 在 生成 过 程 中 考虑 过 去 的 状态 和 当前 的 观测 ， 从 
而 实现 更 加 准确 的 预测 和 生成 。 


1.2 ”GRU 网 络 


GRU 神经 网 络 的 节点 结构 相 比 于 RNN 来 说 复杂 了 很 多 , 除了 状态 信息 和 当 
前 时 刻 输入 之 外 多 出 了 很 多 环节 ， 原 因 在 于 GRU 网 络 引 入 了 门 控 机 制 ， 所 谓 门 
控 机 制 实质 就 是 控制 信息 流动 和 遗忘 的 机 制 。GRU 网 络 引 入 了 两 个 门 ， 分 别 的 


重 置 门 和 更 新 门 ， 如 图 2 方 框 1 和 方 框 2 部 分 所 示 , 分 别 对 两 个 门 的 作用 以 及 原 


理 进行 介绍 : 

(1) 重 置 门 : 重 置 总 的 来 说 就 是 控制 历史 信息 的 遗忘 ， 用 于 更 新 当前 时 刻 
的 隐藏 状态 。 也 就 是 控制 前 一 个 状态 的 隐藏 信息 ht1 哪 些 能 传 进 候选 
状态 ， 通 过 sigmoid 激活 函数 来 控制 当前 时 刻 输 入 和 上 一 时 刻 隐藏 状 
态 的 重要 程度 ， 通 过 点 乘 运算 将 当前 时 刻 输入 和 上 一 时 刻 隐藏 状态 的 
输出 相 乘 , 得 到 一 个 加 权 后 的 输入 值 , 用 于 更 新 当前 时 刻 的 隐藏 状态 。 

(2) 更 新 门 : 更 新 总 的 来 说 就 是 控制 当前 信息 的 选择 性 传递 ， 也 就 是 控制 
前 一 状态 的 信息 hi 有 多 少 信息 能 够 保留 到 新 状态 心中 。 通 过 sigmoid 
激活 函数 来 控制 当前 时 刻 隐藏 状态 的 更 新 程度 ， 通 过 点 乘 运 算 将 当前 
时 刻 输 入 和 上 一 时 刻 隐藏 状态 的 输出 相 乘 ， 并 加 上 一 项 〈1- 更 新 门 控 
单元 的 输出 ) 与 当前 时 刻 隐藏 状态 的 点 乘 运算 ， 得 到 一 个 加 权 后 的 输 
出 值 ， 作 为 当前 时 刻 的 隐藏 状态 。 


:1 (QO) 重 置 门 。 更 新 门 


图 2 GRU 单元 节点 结构 示意 图 
实际 操作 如 公式 1-4 所 示 : 


zi = sigmoid(W,[he_1, xi]) (1) 
ri = sigmoid(W, [hs_1, xi]) 1 
hi = tanh( Wir: © he_i, xi]) (3) 
he=(1 -2z)Oh 1+Zz Oh (4) 


经 过 上 面 控 制 门 操作 之 后 ,也 就 是 进行 了 更 新 记忆 操作 ,能 够 调整 前 一 状态 
的 信息 对 当前 时 刻 的 状态 的 影响 ,从 而 有 选择 性 地 保留 重要 信息 ,抑制 不 重要 信 
息 ， 这 种 选择 性 的 保留 和 抑制 便 能 够 有 效 地 缓解 梯度 消失 和 梯度 爆炸 的 问题 


2 ”VAE-GRU 模型 构建 


传统 的 VAE 模型 不 能 考虑 到 工业 过 程 中 的 动态 性 和 序列 性 ， 所 以 为 了 解决 
这 个 问题 提出 了 一 种 将 GRU 神经 网 络 与 传统 VAE 模型 相 结 合 的 解决 方案 。 因 
此 将 GRU 网 络 加 入 到 传统 的 VAE 模型 中 ,能够 得 到 新 的 VAE-GRU 模型 ,该 模 
型 能 解决 工业 过 程 中 动态 性 的 问题 。 之 所 以 GRU 能 和 VAE 模型 结合 在 一 起 是 
因为 GRU 网 络 的 实质 其 实 就 是 一 层 特殊 的 神经 网 络 ， 而 传统 VAE 模型 的 编码 
器 和 解码 器 是 由 线性 神经 网 络 构成 的 全 连接 层 ， 所 以 只 需要 将 GRU 神经 网 络 分 
别 加 入 到 VAE 模型 的 编码 器 和 解码 器 当中 就 可 以 实现 两 者 的 结合 。 该 模型 的 结 
构 如 图 3 所 示 : 


编码 右 解码 絮 


X 一 > xX 


回归 器 

图 3 VAE-GRU 结构 示意 图 

如 图 3 所 示 ， 只 需要 传统 VAE 模型 中 的 编码 器 和 解码 器 中 加 入 GRU 神经 

网 络 层 即 可 完成 两 者 的 结合 ，GRU 网 络 能 帮助 VAE 更 好 的 提取 输入 的 特征 ， 并 

使 得 该 模型 能 够 关注 到 数据 序列 中 的 前 后 依赖 关系 即 工业 流程 的 动态 性 , 其 次 在 
VAE 模型 中 加 入 回归 器 模块 可 以 实现 数据 建 模 并 输出 对 数据 序列 的 预测 值 。 


3 ”实验 设置 与 结果 分 析 


3.1 数据 说 明 


为 了 验证 该 模型 的 实用 价值 和 有 效 性 , 使 用 到 了 脱 丁 烷 系 统 过 程 建 模 中 ,用 于 预 
测 脱 丁 烷 塔 底部 丁 烷 含 量 。 脱 丁 烷 塔 是 炼油 三 中 重要 的 分 离 设 备 之 一 ,用 于 将 石 
油 中 的 丁 烷 和 了 丁 烯 分 离 出 来 , 在 脱 丁 烷 塔 的 生产 过 程 中 , 各 种 因素 会 影响 其 操作 
效率 和 产品 质量 , 如 温度 , 压力 , 流量 等 参数 变化 。 图 4 具体 的 描述 了 这 个 过 程 ， 
塔 底 丁 烷 含量 作为 衡量 脱 丁 烷 效 果 的 关键 过 程 变量 需要 被 重点 关注 。 传 统 的 丁 烷 
量 观测 采用 物理 模型 和 经 验 模 型 , 需要 大 量 的 人 工 干 预 和 参数 调整 ， 且 在 处 理 非 
线性 ， 多 变量 ， 高 维 数据 时 存在 一 定 的 局 限 性 ， 并 且 具 有 较 大 的 浪 后 性 。 针 对 这 
些 问 题 一般 采 用 软 测量 技术 , 可 以 更 好 的 帮助 优化 工艺 参数 , 提高 产品 质量 和 能 
源 利用 率 ， 实 现 更 加 高 效 ， 更 精准 ， 更 自动 化 的 生产 控制 。 


图 4 脱 丁 烷 塔 过 程 流 程 图 

经 过 一 定 的 相关 性 分 析 之 后 , 为 了 更 加 精确 控制 脱 丁 烷 塔 工作 效率 ,选取 出 
了 7 个 与 塔 底 丁 烷 含 量 相关 性 及 强 并 且 可 以 即时 观测 的 过 程 变量 , 用 于 建立 软 测 
量 模型 。 表 1 给 出 了 这 些 变量 的 具体 描述 以 及 具体 数据 ， 主 要 包括 温度 ， 压 力 ， 


流量 等 。 这 些 数据 一 共 为 2394 组 ， 每 组 七 个 变量 ， 在 进行 实验 室 按照 实验 设 定 
将 数据 集 分 为 训练 集 和 测试 集 ， 然 后 再 进行 实验 。 
表 1 脱 丁 烷 塔 过 程 变量 描述 表 


序号 过 程 变 量 
1 炉 顶 温度 (CC ) 
2 炉 顶 压力 (kPa) 
3 回流 流量 (wm. s-1) 
4 流向 下 一 个 过 程 的 流量 (m3. s-1) 
5 第 6 隔 板 温 度 (CC ) 
6 炉 底 温度 A(C) 
7 炉 底 温度 B(C) 
8 底部 丁 烷 含量 (%) 


3.2 ”实验 设置 与 步骤 


3.2.1 实验 设置 


实验 采取 对 比试 验 的 方式 , 采用 多 种 不 同 的 填补 方式 对 不 同 缺 失 率 的 不 完整 
数据 进行 填充 , 然后 分 别 将 每 个 算法 填充 好 的 数据 放 到 训练 好 的 建 模 预测 模型 中 


进行 预测 , 最 后 输出 各 个 算法 的 均 方 根 误差 进行 评价 , 并 给 处 可 视 化 妃 踪 图 和 误 
差 盒 图 。 实验 中 涉及 的 算法 包括 传统 VAE 模型 填补 ，VAE-GRU 模型 填补 ，PCA 
填补 3 种 方法 。 其 中 采用 的 评价 指标 是 均 方 根 误差 (RMSE), 它 的 实质 就 是 用 来 
测量 数据 之 间 差 异 的 量度 , 在 这 里 是 用 来 计算 实验 中 预测 值 与 真实 值 之 间 的 误差 
均 方差 误差 的 计算 公式 5 所 示 : 


Rrmse = |E x EP — 8) (5) 


上 式 中 入 表示 缺失 数据 的 个 数 ，X 和 名 分 别 表 示 真 实数 据 和 数据 预测 值 。 
3.2.2 实验 步骤 


首先 搭建 完整 VAE-GRU 模型 , 该 模型 主要 的 功能 是 实现 对 完整 数据 集 进 行 
回归 建 模 ,然后 输出 数据 的 预测 值 。 使 用 不 含 缺失 值 的 数据 对 模型 进行 训练 ， 由 
回归 器 建 模 产 生 预 测 值 ， 利 用 生成 的 预测 值 和 训练 值 的 均 方 误差 以 及 VAE 生成 
器 的 重 构 损失 反 向 传播 , 优化 模型 建 模 预 测 的 真实 性 ， 实现 对 完整 数据 的 建 模 预 
测 。 模 型 的 搭建 描述 如 下 : 

(1) 设 定 模型 相关 参数 ， 包 括 神 经 网 络 的 层 数 ， 神 经 元 个 数 等 相关 参数 ， 并 对 
全 体 样本 进行 处 理 时 序 化 处 理 ， 样 本 划分 ， 归 一 化 处 理 

(2) 使 用 训练 数据 集 对 模型 进行 训练 , 用 梯度 下 降 法 和 反 向 传播 法 来 实现 整个 
网 络 的 训练 学 习 ， 并 计算 出 均 方 根 误差 和 KL 散 度 

(3) 将 测试 数据 集 放 入 训练 好 的 模型 当中 , 进行 建 模 预 测 ， 并 给 出 最 后 的 预测 
误差 和 可 视 化 追踪 图 

(4) 将 该 模型 保存 用 于 经 过 填补 后 的 完整 数据 的 建 模 预 测 

然后 搭建 VAE 填补 模型 ，VAE-GRU 填补 模型 ,， PCA 填补 模型 ， 分别 将 各 个 
模型 用 于 含 缺 失 值 数据 的 填补 , 然后 将 填补 好 的 数据 用 于 回归 预测 , 观察 各 组 填 
补 数据 得 到 预测 值 与 真实 值 的 差异 ， 最 后 分 析 各 个 填补 模型 。 

3.2.3 模型 结构 
结构 设计 方面 ， 将 GRU 网 络 加 入 到 VAE 的 编码 器 和 解码 器 结构 中 ， 其 中 编码 
器 输出 ， 解 码 器 输出 和 回归 层 输出 均 采 用 LeakyRelu 激活 函数 。 其 它 网 络 充分 


考虑 模型 计算 量 设置 如 表 2 所 示 : 
表 2 VAE-GRU 模型 参数 设置 


所 属 模 型 结构 节点 数 
编码 层 GRU 12 
编码 层 线性 层 20 
编码 层 线性 层 20 
解码 层 GRU 6 
解码 层 线性 层 16 
解码 层 线性 层 12 
回归 层 GRU 6 


3.2.4 模型 对 比分 析 


三 个 模型 分 别 对 数据 集 缺 失 率 为 10% 和 30% 情 况 下 进行 填补 ， 将 填补 后 的 
数据 回归 预测 得 到 实验 结果 如 图 5- 图 10 所 示 : 


400 


5 PCA 算法 填补 建 模 结果 〈 缺 失 率 10%) 


1000 1200 


6 PCA 算法 填补 建 模 结果 缺失 率 30%) 
从 结果 看 出 不 同 缺 失 率 对 PCA 算法 的 填补 有 较 大 影响 , 并 且 整 体 看 PCA 的 
填补 精度 很 不 理想 ， 这 是 因为 PCA 算法 在 进行 填补 时 是 假设 数据 应 该 服从 线性 
分 布 ， 但 是 在 实际 工业 流程 中 ， 数 据 往往 是 呈 非 线性 和 非 正 态 分 布 ， 这 会 导致 处 
理 数 据 时 失去 一 些 信息 。 其 次 PCA 是 一 种 无 记忆 的 算法 ， 也 就 是 它 将 每 个 时 间 
步 的 样本 视 为 独立 的 数据 点 , 并 没有 考虑 到 时 间 序 列 数据 的 先后 顺序 和 时 间 关 系 。 


al Value 
一 -- VAE(missing-10%) 


图 7 传统 VAE 模型 建 模 预 测 结果 〈 缺 失 率 10%) 


图 8 传统 VAE 模型 建 模 预测 结果 (缺失 率 30%) 

从 上 述 结果 可 以 直观 地 看 到 传统 VAE 模型 对 时 间 序 列 数 据 的 填补 效果 并 不 

好 ,不 管 是 10% 缺 失 率 还 是 30% 缺 失 率 误差 都 在 5% 以 上 ， 可 以 说 建 模 效 果 不 理 

想 。 之 所 以 出 现 这 样 的 结果 是 因为 传统 VAE 模型 在 填补 数据 时 不 能 很 好 的 考虑 

到 工业 过 程 数据 的 动态 性 , 所 以 预测 的 结果 跟 实际 工业 流程 的 结果 会 有 较 大 偏差 ， 

并 且 当 缺失 率 增 大 时 对 模型 的 准确 度 影 响 很 明显 , 从 可 视 化 追踪 图 中 可 以 很 清晰 
的 看 出 来 ， 缺 失 率 在 30% 的 时 候 误 差 明 显 增 大 了 不 少 


Actual Value 
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图 9 VAE-GRU 模型 建 模 预 测 结 果 (缺失 率 10%) 
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图 10 VAE-_CRU 模型 建 模 预 测 结果 缺失 率 30%) 
从 上 述 结果 看 出 ， 经 过 GRU 网 络 改 进 的 VAE-GRU 模型 在 实验 中 的 表现 有 


显著 提高 。 首 先是 准确 度 方面 ， 误 差 有 了 明显 降低 ， 已 经 降 到 了 5% 以 内 ， 这 已 
经 能 够 很 好 的 说 明 该 模型 的 有 效 性 和 该 改进 的 可 行 性 。 其 次 模型 的 稳定 性 方面 也 
有 了 很 好 的 提高 ， 传 统 的 VAE 模型 在 缺失 率 不 同 的 情况 下 ， 模 型 准确 度 会 有 较 
大 的 影响 , 但 是 改进 后 的 VAE-GRU 模型 在 不 同 缺失 率 下 准确 度 非 常 稳 定 。 所 以 
经 过 以 上 两 个 模型 的 结果 对 比 以 后 能 很 好 的 证 明 该 模型 对 传统 VAE 模型 确实 能 
有 很 大 的 提升 。 


表 3 不 同 模型 预测 对 比 效果 


模型 RMSE (10%) RMSE (30%) MAE (10%) MAE (30%) 
传统 VAE 4. 020% 5. 904% 2. 884% 4. 341% 
PCA 12. 724% 21. 468% 8. 713% 15. 121% 
VAE-GRU 3. 316% 4. 262% 2. 386% 2. 964% 


很 明显 可 以 看 出 不 管 在 多 少数 据 缺 失 率 下 ， 三 个 模型 中 VAE-GRU 模型 的 预 
测 误差 都 是 最 小 ， 并 且 相 比较 于 传统 VAE 模型 在 准确 度 上 也 有 了 不 小 的 提升 。 
这 充分 验证 了 将 GRU 网 络 和 VAE 相 结 合 的 理论 可 行 性 ， 说 明 GRU 网 络 能 够 
VAE 模型 带 来 更 好 的 收益 , 也 说 明了 VAE-GRU 模型 有 更 好 的 模型 拟 合 能 力 , 更 
强 的 预测 能 


4 结论 

针对 数据 缺失 这 种 情况 ， 提 出 了 一 种 基于 变 分 自 编码 器 (Variational Auto 
encoder，VAE ) 的 填补 模型 ， 该 模型 能 够 很 好 的 将 数据 进行 降 维 处 理 并 获取 数据 
中 的 隐藏 特征 ， 再 根据 得 到 的 数据 特征 给 出 缺失 数据 的 预测 值 ， 进 而 能 使 用 预测 
值 将 缺失 的 数据 填补 上 。 但 是 又 考虑 到 VAE 模型 不 能 考虑 到 工业 过 程 中 的 动态 
性 和 序列 性 ， 本 文 提 出 了 将 递归 神经 网 络 与 传统 VAE 模型 相 结合 的 解决 方案 。 
递归 神经 网 络 选择 到 了 GRU 神经 网 络 ， 基 于 该 神经 网 络 的 良好 性 能 与 传统 VAE 
模型 相 结合 ， 构 成 的 VAE-GRU 模型 不 仅 能 够 增强 对 数据 特征 的 提取 能 力 ， 还 能 
考虑 到 数据 序列 的 动态 性 和 变化 规律 , 并 且 该 模型 拥有 很 强 的 建 模 能 力 , VAE 部 
分 负责 潜在 特征 的 提取 ，GRU 部 分 则 负责 建 模 时 序数 据 的 动态 演变 。 
基于 以 上 的 理论 ,建立 了 VAE-GRU 模型 ， 并 应 用 于 脱 丁 烷 塔 中 关键 过 程 量 
塔 底 丁 烷 量 的 预测 ， 同 时 与 目前 常用 的 缺失 数据 填补 算法 以 及 传统 VAE 模型 进 
行 了 对 比试 验 , 在 实验 中 本 文 建立 的 模型 取得 了 最 好 的 结果 , 验证 了 模型 的 有 效 
性 和 实用 性 。 在 10% 数 据 缺 失 情况 下 ，VAE-GRU 模型 的 输出 结果 均 方 根 误差 为 
3.316%， 平 均 误差 为 2.386%， 在 30% 缺 失 率 情况 下 ， 输 出 结果 均 方 根 误 差 为 
4.262%， 平 均 误 差 为 2.964%， 相 比 于 其 它 四 种 填补 算法 的 表现 来 看 还 是 很 不 错 
的 


当然 , 本 文 建立 的 模型 还 是 存在 一 些 问题 和 不 足 , 例如 该 模型 不 能 自动 适应 
多 种 维度 的 数据 ,每 次 使 用 不 同 的 数据 都 需要 先 对 模型 进行 训练 , 并 且 需 要 对 数 
据 进 行 不 同 的 预 处 理 。 另 外， 本 文 所 建立 的 模型 在 缺失 率 较 高 的 情况 下 准确 度 暂 
时 还 不 是 非常 高 , 仍 存 在 一 定 误差 , 暂时 还 没有 找到 较 好 的 方式 来 降低 这 个 误差 ， 
这 些 问题 都 有 待 于 今后 进一步 探索 和 研究 。 
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